perceptionllm

视觉语言模型新突破！ Perception LLM硬刚GPT-4o

极市导读：PLM团队用280万人工标注与6610万合成数据，首次在完全开源、零蒸馏的框架内把细粒度视频理解推到逼近GPT-4o的水平，并发布PLM-VideoBench，为社区提供一把可复现的视觉语言模型“透视镜”。